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基于 课程 间 关联 规则 的 排 课 优化 算法 研究 “ 
庞 书 杰 ， 刘 其 成 '， 牟 春晓 


(烟台 大 学 计算 机 与 控制 工程 学 院 ， 山 东 烟台 264005) 


摘 要 : 针对 如 今 高 校 招生 人 数 扩张 所 伴随 而 来 的 高 校 排 课 资源 紧张 的 现象 进行 了 研究 ， 提 出 了 一 种 基于 关联 规则 的 
排 课 优 化 算法 (SH-AP 算法 ) 来 优化 高 校 排 课 。SH-AP 算法 将 关联 规则 算法 应 用 到 排 课 过 程 中 ， 通 过 对 高 校 学 生 选 课 数 
据 进行 关联 规则 的 挖 据 ， 找 出 需要 排 课 的 课程 之 间 的 关联 规则 , 之 后 SH-AP 算法 再 将 已 经 挖掘 出 的 课程 闻 关 联 规则 应 
用 到 排 课 系 统 中 ， 对 高 校 排 课 进行 优化 。 实 验 最 终 得 到 课程 间 关 联 规则 的 数据 ， 并 为 高 校 提 供 人 性 化 的 排 课 。 根 据 研 
究 与 对 比 表 明 SH-AP 算法 在 对 排 课 的 合理 化 与 人 性 化 上 有 很 好 的 优化 效果 ， 帮助 学 校 在 进行 排 课 的 时 候 ， 考 虑 课程 时 
间 地 点 冲突 问题 的 同时 ， 对 学 生 的 需求 进行 满足 。 
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Research on timetabling optimization algorithm based on inter curriculum association rules 


Pang Shujie, Liu Qicheng', Mu Chunxiao 
(School of Computer & Control Engineering, Yantai University, Yantai Shandong 264005, China) 


Abstract: For nowadays the enrolment expansion of colleges and universities to universities curriculum resources nervous 
phenomena are studied, proposed an optimization scheduling algorithm based on association rules (SH-AP algorithm) to 
optimize curriculum in colleges and universities. SH-AP algorithm applied the association rules algorithm in the curriculum 
arrangement process, through to the university students' course selection data for association rules mining, found out 
association rules between need arranging courses. SH-AP algorithm then had been digging out association rules between the 
course of curriculum arrangement system, applied to optimize the curriculum in colleges and universities. The experiment 
finally obtains the data of the association rules between the courses, and provides the humanized curriculum for the university. 
According to the research and comparison, the SH-AP algorithm has a good optimization effect on the rationalization and 
humanization of the scheduling. This algorithm can help the school to consider the conflict of time and place in the course of 
scheduling, and satisfy the needs of students. 
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的 选择 性 。 而 学 生 在 选择 课程 的 时 候 会 留 下 大 量 数据 ， 这 些 数 
出 据 包含 了 学 生 喜 欢 的 课程 间 的 关系 。 同 时 ， 选 修 课 的 设立 加 大 
如 今 的 人 们 平均 受 教育 水 平 提高 ， 越 来 越 多 的 人 走 进 了 大 ”了 学 校 的 排 课 压 力 ， 如 何在 对 所 有 课程 的 上 课时 间 地 点 进行 合 
学 校园 ， 全 国 各 个 高 校 的 招生 人 数 大 幅度 提高 。 而 高 校 一 年 比 理 的 排 课 的 同时 尽量 满足 学 生 的 选课 需求 ， 使 得 学 生 喜 欢 的 课 
一 年 多 的 新 生 入 学 ， 导 致 如 今 高 校 教学 资源 极度 紧张 趾 。 当 代 ” 程 不 会 产生 冲突 , 是 现 如 今 高 校 排 课 所 迫切 需要 解决 的 问题 加。 
大 学 生 在 大 学 期 间 也 已 经 不 仅仅 满足 对 自己 本 身 专 业 知识 的 需 同时 随 着 大 数据 被 用 于 服务 教育 和 科学 一 个 共同 条 

求 ， 都 想 要 更 加 全 面 的 发 展 自己 。 而 每 个 学 生 在 专业 知识 的 妇 标 , 教育 数据 挖掘 方面 的 技术 也 得 到 了 迅猛 发 展 。 如 关联 规则 、 
础 上 ， 想 要 扩展 的 方向 也 各 不 相同 。 因 此 ， 各 高 校 在 给 大 学 生 ”分 类 和 聚 类 的 数据 挖掘 技术 在 教育 数据 中 得 到 了 灵活 运用 。 通 
们 安排 了 专业 必修 的 专业 课程 外 ， 还 为 广大 大 学 生 们 提供 了 各 ”过 对 高 校 选课 数据 的 信息 数据 挖掘 ， 可 以 发 现 其 中 的 课程 间 的 
种 方面 的 包括 文科 、 理 科 和 工科 的 选修 课程 外。 关联 规则 。 高 校 管理 者 可 以 根据 这 些 挖掘 的 关联 规划， 更 好 的 
高 校 选修 课 的 设立 ， 使 得 学 生 对 自己 的 学 习 方 向 有 了 更 高 。 来 进行 高 校 课程 间 的 排 课 ， 避 免 出 现 课程 排 课 冲 突 。 
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关联 规则 算法 是 数 扩 
中 Apriori 算法 更 是 十 大 经 
的 算法 之 一 由 。 但 它 在 挖掘 关联 
以 及 大 量 的 IO 的 帮 
在 Apriori 之 上 , 优化 了 对 
居 ， 减 少 了 VO 也 

本 文 提出 的 基于 课程 
通过 对 往届 进行 关联 规则 挖 扩 


访问 数 提 


出 现 的 排 课 冲突 问题 。 


1 


相关 工作 


ph 


F 销 号 。DHP 算 


要 的 组 成 部 分 ， 其 
数据 算法 之 一 ,也 是 影响 最 为 深远 
大 量 候选 项 集 ， 
的 改进 算法 ， 它 


其 不 必 再 大 量 的 


则 关联 规则 的 排 课 


优化 算法 SH-AP 
轴 ， 从 而 尽 最 大 可 能 的 减少 排 课 中 


关联 规则 算法 自 被 提出 到 现在 一 直 是 数据 挖掘 中 十 分 重要 


四 获得 J 


t 


的 组 成 部 分 之 一 。 各 式 各 样 的 关联 规则 算法 被 提出 ， 并 在 多 方 
广泛 的 应 用 ， 如 在 金融 业 、 销 售 } 


以 及 监控 预测 行业 


中 的 应 


及 应 月 


不 足 之 处 ， 提 出 通过 关联 规 由 


数据 进行 


19。 当 前 许多 专家 学 者 对 关联 规则 算法 相关 的 内 容 以 
进行 了 大 量 研究 。 

文献 [7] 将 关联 规则 算法 那 应 用 
气象 观测 设备 收集 数据 有 
书 推荐 系统 的 


F 气象 观测 设备 中 , 来 保证 
] 通 过 分 析 现 有 的 图 
I 算法 来 对 图 书 借阅 


挖掘 ， 以 便 提供 更 人 性 


推荐 服务 。 文 献 [9] 通 


过 一 利 
挖掘 ， 找 出 


处 理 ， 对 食品 安全 问题 的 
究 都 是 从 不 同 的 应 用 
昌 。 但 伴随 着 关联 规则 的 挖 
需要 不 断 的 扫描 数据 库 ， 造 成 极 大 上 

本 文 是 从 高 校 排 课 的 角度 使 用 关联 规 


以 上 而 
数据 挖 


FP 改进 和 


的 关联 规则 算法 到 
电子 病历 系统 中 区 
助 。 文 献 [10] 则 是 根据 关 有 


I 历史 数据 进行 
医生 诊 诊 断 提供 帮 
则 算法 对 食品 生产 加 工 数据 进行 


则 算法 进行 优化 。 高 


校 选 课 排 课 也 是 高 校 和 大 学 4 


的 主要 任务 之 一 ， 也 是 促进 学 生 


发 展 的 全 夯 
校 的 选课 提 


步 进行 预警 。 


j 关 联 规则 算法 进行 


的 候选 项 集 ， 


化 的 重要 组 成 部 分 。 当 前 已 经 有 部 分 专家 学 者 对 高 


FE 课 情况 进行 太 


模型 上 的 村 
对 学 生 与 课程 数量 的 增 大 ， 设 计 实现 了 教务 提 
高 排 课 工作 的 准确 性 逢 
系统 ， 研 究 了 一 种 微机 的 排 课 系统 ， 促 进 
和 现代 化 。 以 上 是 研究 
合理 性 进行 研究 和 应 用 。 
排 课 的 
文献 [12] 与 文献 [13] 中 ， 则 都 是 ] 


昌 高 校 现 如 今 的 学 分 
制 的 基础 下 ， 以 课程 为 中 心 构建 计算 机 排 课 系统 的 模型 。 对 此 


FE 课 问题 进行 讨 


给 出 了 解决 办 法 。 文 献 [12] 中 针 


= 


影响 ， 忽 视 了 学 生 


F 课 管理 系统 来 提 
生 。 文 献 [13] 中 通过 关系 型 数据 库 


管理 的 信息 化 


通过 不 同方 面 来 对 高 校 排 


课 的 准确 性 和 


昌文 献 [11] 仅 仅 讨论 了 学 分 对 于 高 校 
于 课程 选择 的 主观 性 


> 不 全 面 。 


学 校 的 所 有 课程 进行 排 


课 ， 仅 仅 考 虑 到 了 学 校方 画 
需求 。 

为 了 解决 上 述 问 题 ,本 文 提出 了 者 
高 校 排 课 优 化 算法 (SH-AP 算法 )， 


课 数 所 


居 进 行 关联 规则 分 本 


， 而 忽视 了 学 生 的 选课 


于 关联 规则 DHP 算法 的 


其 目的 是 为 了 通过 对 学 生 选 


岗 对 高 校 排 课 的 进 


兼顾 高 校 排 课 的 同时 根 和 


选课 喜好 对 排 课 进 


步 优化 。 在 
行 优化 。 本 文 


先 将 学 生 选 课 数 ] 
SH-AP 算法 迅速 得 检 课 程 引 
关系 的 闵 值 。 最 后 根据 课 


进行 预 处 理 ， 
苦 合 的 候选 项 自 
程 间 关系 的 阔 值 对 排 课 进 行 优 化 ， 使 


排 课 能 更 加 人 性 化 与 合理 化 。 


2 ”SH-AP 算法 设计 


本 文 提 出 的 SH-AP 算 法 是 基 了 


相 较 传统 Apriori 算法 减少 了 候选 


将 高 校 学 生 的 选课 数据 通过 该 算法 进行 挖 据 ， 为 高 校 的 提 


然后 根据 选课 数 ] 


攻 ， 挖 折 


项 集 的 数量 ， 


FDHP 的 高 校 排 课 优化 算法 。 
于 销 。 


2.1 DHP 算法 简介 


关联 规则 是 | 


信 度 。 其 中 最 4 


一 个 项 集 在 数据 库 中 出 现 的 频率 。 另 一 个 阔 值 ， 最 小 


指 满足 置信 度 的 最 小 值 ， 置 信 度 则 是 通过 支持 度 计算 得 至 


外 


关联 规则 算法 是 根 ] 


到 候选 2 项 集 。 


2 项 集 剪 枝 ， 得 至 
再 产生 新 的 候选 : 
繁 项 集 后 在 根 和 


R 据 最 小 支持 度 对 各 项 的 进 
| 频繁 2 项 集 。 然 


个 项 目 集合 中 包含 A 的 概率 下 ， 包 含 B 的 概率 ""。 


昌 最 小 支持 度 得 到 频繁 1 项 集 ， 


居 ， 通 过 
8 表示 课程 间 


FE 课 提 


两 个 病 值 确定 ， 分 别 为 最 小 支持 度 和 最 小 置 
> 支持 度 是 指 满足 支持 度 的 最 小 值 ， 支 


村 度 则 是 


R 


或 者 不 再 产 昌 


DHP 算法 设计 


E 新 的 频繁 项 


后 继续 循环 向 下 去 ， 


信和 度 是 


1， 表 


十 候选 
直到 不 
攻 为 止 。 得 到 频 


应 的 置信 度 算 法 算出 置信 度 , 得 到 关联 规则 。 


的 思想 初衷 ， 就 是 为 了 针对 传统 关联 规则 算 


法 Apriori 算法 在 挖掘 关联 规则 时 所 产生 的 很 大 规模 的 候选 项 


nl 


主要 是 用 来 减少 K 项 


着 。DHP 算法 的 作 / 


DHP 算法 主要 分 为 四 个 部 分 : 


1) 扫描 数据 库 D 


扫描 数据 库 D， 得 至 
以 及 项 目 身 
Tili=12…,D) 满 足 TkEI， 而 


项 事务 集合 ， 


的 一 个 子 和 


uy 
o 


A 


洱 


主要 体现 在 Apriori 算法 
民选 项 集 的 个 数 。 


2) 构建 Hash 表 


扫描 数据 库 D, 在 第 k 次 扫 
项 集 ， 将 生成 的 k+l1 项 集 带 入 到 Hash 函数 当 


进行 计数 。 


| 


7 


时 ， 每 项 事务 


3) 根据 Hash 桶 筛选 候选 项 集 


对 于 桶 中 元 素 个 数 


的 计数 ， 若 桶 中 元 素 个 数 小 


度 , 则 该 哈 希 值 所 对 应 桶 中 元 素 


选项 集中 删除 。 


4) 根据 候选 项 集 求 得 频繁 项 集 


根据 得 到 的 候选 项 集 Ce 扫描 数 寺 


定 不 是 频繁 项 集 ， 


| 数据 库 D={Ti,T2,T3…,Tn}，Ti 表 示 每 
I={11,12,13,L4,Is }。 
本 的 习 


每 一 个 事务 


有 务 Ti 都 分 别 是 项 目 集合 I 


身 的 k+1 
哈 希 值 。 
根据 其 哈 希 值 放 入 到 该 哈 希 值 对 应 的 桶 中 ,并 对 桶 中 元 素 个 数 


F 最 小 支持 
从 候 


昌 库 , 统计 其 支持 度 个 数 ， 
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若 大 于 最 小 支持 度 则 加 入 到 频繁 项 目 集 Lkn。 


返回 道 筛选 下 一 个 Cs2 候选 项 集 以 此 4 


册 


项 集 产生 或 者 没有 新 的 频繁 项 集 产生 。 


2.2 SH- 


AP 算法 设计 


SH-AP 算法 主要 是 分 为 三 个 部 分 。 


a) 首 先 将 学 生 们 的 选课 数据 进行 预 处 理 ， 
进行 关联 规则 挖掘 的 必要 部 分 。 
集 ，D={Ti,T2,T3.…,Tn} 作 为 学 生 选 课 的 数据 和 
标志 的 每 一 个 事务 表示 为 学 生 ID, 之 后 每 个 
为 该 学 生 选 课 的 情况 。 


得 到 Le 后 继续 


盾 环 ， 直 到 没有 新 的 候选 


山中 


课 的 课程 集合 。 


机 等 11 项 学 科 课 程 。 


和 外 
二 


nt 
一 


b) 学 生 课程 间 关 
带 入 到 关联 规则 算法 


其 规则 的 数据 挖掘 阶段 。 


中 进行 数据 挖掘 ， 得 至 


关联 规则 以 及 该 关联 规则 的 支持 度 和 置信 度 。 


7 


lt 


这 部 分 是 接 下 来 


将 学 生 们 的 选课 数据 做 为 训练 


的 人 
务 


A 


a 


合 。 其 中 Ta 
今 
后 


的 项 目 集 


I={I ,2,L3,14,...In} 则 是 表示 可 供 学 生 选 
课程 包括 了 计算 机 导论 、Java 


四 向 对 象 和 单 上 


将 学 生 数据 训练 
| 各 个 课程 之 间 的 


9 对 已 经 得 到 的 关联 规则 以 及 它 的 置信 度 和 支持 度 进 行 分 


村 
理 。 


ru 


SH-AP 算法 的 三 个 部 分 中 ,第 一 部 分 数据 预 处 理 阶 段 是 1 


析 ， 增 加 一 个 新 的 闵 值 提升 度 。 根 
系 进 行 排序 ， 将 排序 结果 反馈 给 高 校 管理 
据 得 道 


昌 提 升 度 的 值 对 课程 间 的 关 


E 人员。 高 校 管 理 人 员 
的 关联 规则 以 及 提升 度 的 值 对 排 课 的 安排 进行 优化 处 


人 工 完 成 ， 将 课程 数据 转换 为 数字 字母 代替 。 
三 部 分 是 SH-AP 算法 的 核心 部 分 。 


2.2.1 学 生 课 程 的 关 


医 规 则 挖掘 


扫 


学 生 数 据 库 D 得 到 学 生 选 课 数据 肌 


AT 


项 目 集 为 该 学 生 选 课 的 情况 。 例 如 ， 项 目 和 外 


lu 


为 学 生 选课 的 课程 集合 ， 学 生 在 其 中 任 选 两 项 以 上 课程 。 算 法 


第 二 部 分 以 及 第 


每 个 事务 包含 的 
I={T1,12,13,L4,...In} 


的 执行 条 件 设 为 最 小 支持 度 满足 minsup 大 于 等 于 0.2， 即 在 选 
课 的 总 数据 库 中 该 选课 的 课程 集合 元 素 出 现 次 数 至 少 为 20%。 


根据 学 9 


频繁 项 目 


首先 ， 扫 
Ce=(IJPJHEJIJUS))。 并 统计 Cia 


集 工 中 。 


出 学 生 所 选课 程 满足 支持 度 的 课程 频繁 1- 项 集 Li。 将 数据 库 中 


每 个 学 生 


学 生 选 课 数据 库 生 成 选课 课程 的 候选 1- 项 集 
h 每 项 课程 的 支持 度 ， 求 


E 的 选课 数据 ， 将 满足 最 小 支持 度 的 课程 组 合 放 入 


自己 选择 的 课程 进行 连接 组 合 ， 得 到 


程 集合 本 身 的 课程 候选 2- 项 集 。 


算法 描述 如 


Input: student data 


Output: cx 


for each Student Data do 


(1) 
(2) 
G3) 
(4) 


Cdhp={ Courses for each student}; 
Li={ each course € Cdhp)}; 
L2={ each course € Cdhp)}; 


if (Li[k-1]<L2[k-1])&&Li[n]=L2[n]) 


| 每 个 学 生 所 选课 
下 : 


end 


将 所 得 到 的 每 个 学 4 


Chin 


/*n={1,2,3...k-2}*/; 
c=Liconnect DL; 


HashFunction(c); 


将 E 得 到 的 候选 项 集 cx 中 的 课程 组 合 , 分 
别 通 过 哈 希 函数 进行 分 类 。 通 过 hash 函数 计算 出 课程 集合 中 每 


个 课程 组 合 的 哈 希 值 ， 即 该 课程 组 合 的 存储 地 址 。 将 地 址 相同 


的 课程 集合 中 的 课程 组 合 放 在 同一 集合 桶 中 ， 并 对 该 地 


集合 桶 中 的 课程 集合 元 素 的 个 数 进行 计数 。 算 法 描述 如 下 : 


Input: Student data 


Output: Lx 


for each 
(1) 
(2) 

G3) 


(4) 

(5) 

(6) 
(7) 


(8) 
(9) 
(10) 
(11) 
(12) 
(13) 


end 


之 后 ， 


的 课程 组 合集 合 ， 将 


student 
for ck E each student 


{xX,y} E Cx; 


/*course combination*/ 


FE 下 的 


HashValue (x ,y)= (( order of x) X10 + (order of y)) 


mod7; 
HashB [HashValue][1] add 1; 
for each LIXI1 


{x,y} E LIXIL1; 


HashValue (x ,y)= (( order of x) X10 + (order of y)) 


mod7; 
If(HashB [HashValue][1]>=minsup) 
{x,y}add to Cr add; 
for each cE Crk 
for each TED 
ifcETc.sup add 1; 


if c.sup>=minsup add c to Lx; 


根据 课程 频繁 项 目 集 LI 通过 自 连接 得 到 一 个 2- 项 集 
其 中 元 素 带 入 到 Hash 函数 中 得 到 哈 希 值 。 
将 其 哈 希 值 对 应 桶 的 计数 小 于 minsup 的 元 素 从 候选 项 集中 删 


除 ， 其 余 加 入 候选 项 集 。 之 后 对 候选 项 集 计 数 ， 大 于 minsup 


的 加 入 到 频繁 项 集 工 中 。 之 后 循环 下 去 得 到 所 


了 频繁 项 集 。 


在 传统 的 Apriori 算法 中 , 对 学 生 数 据 挖掘 的 时 候 会 产生 大 


程 间 关 


数据 库 ， 


从 而 造成 了 大 量 的 VO 开销 。 


需要 扫 
自 连接 产 往 


到 的 课程 候选 项 集 所 建立 的 
中 计数 不 满足 最 小 值 支持 度 的 课程 集合 ， 从 而 得 到 候选 项 集 。 


居 选 项 集 需 要 多 次 的 扫 


量 的 课程 集合 候选 项 集 。 在 对 候 课程 集合 计数 阶段 ， 每 个 候选 
项 集 的 计数 都 需要 对 学 生 数据 库 进 行 
基 规 则 需要 多 次 扫描 数据 库 。 例 如 104 个 频繁 1- 项 集 就 
可 能 产生 107 个 候选 2- 项 集 。 如 此 多 的 


次 扫描 ， 最 终 挖掘 出 课 


本 文 提 出 的 SH-AP 算法 通过 减少 候选 项 集 的 个 数 来 减少 
描 数据 库 的 次 数 ， 从 而 减少 VO 开销 。 在 课程 频繁 项 集 
的 课程 集合 后 ， 通 过 对 比 之 前 根 ; 


居 每 个 学 生 选 课 得 


Hash 桶 集合 来 进行 


第 选 ， 删 除 桶 
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相 比 传统 Apriori 算法 减少 了 产生 的 候选 项 集 的 个 数 。 候 选 


项 集 


的 减少 使 得 在 对 每 个 课程 集合 的 候选 项 集 计 数 的 时 候 扫 措 
数据 库 的 次 数 减 少 ， 从 而 减少 了 IO 开销 。 


2.2.2 基于 关联 规则 的 排 课 优化 

通过 第 二 部 分 关联 规则 的 挖掘 
间 的 关联 规则 和 它 的 支持 度 以 及 置信 度 。 这 里 加 入 提升 度 
作为 一 个 新 的 闷 值 。 根 据 课 程 间 的 提升 度 的 大 小 来 确定 高 
课时 课程 排 课 的 优先 级 。 提 升 度 越 大 ， 关 联 性 越 高 。 


疙 全 
千 学 和 牛 


得 到 了 学 生 选 课 的 课程 之 


Lift 
校 排 


读 取 数 据 库 Di 得 到 已 初次 排列 的 课表 。D1 为 周一 到 周 五 


的 排 课 数据 ， 其 中 Xi={Ti,T2,…,Ts} 表 示 一 天 的 课时 ， 


Tn={L 


EIT} 则 是 表示 的 在 课时 Tn 时 需要 
Ci={(course,Lift)|course ET} 则 代表 了 与 所 
和 提升 度 Lift 的 集合 。 每 个 课程 根据 必修 课 和 选修 课 不 同 
一 个 标记 star， 若 star 为 1 或 0 分 别 为 必修 课 与 选修 课 。 


到 优化 过 的 课表 D,。 算 法 描述 如 下 : 


Input: Timetable data Di 
Output: Schedule D> 

for each PEI /*I ETnOn=1.2,S)3/ 
(1) mix=0 

(2) for each Lift € Cx 

(3) if(Lift<mix) mix=Lift; 

(4) for 1<=Cx.size 

(5) ifilift==mix c= i.course; 
(6) ifcETn 


(7) for eachTEDWT is one period 


(8) ifT!=T, 
(9) for each I ET 
(10) if Ti.star <= c.Star 
(11) note=c 
(12) for each Ci 
/*prevent error replacement*/ 

(13) 这 Ci.lift >= mix) 
(14) if(Cj.course E Tn ) continue; 
(15) X=c; c=1;; I= x;break; 
(16) if note == c break; 

end 


上 述 程序 根据 提升 度 的 大 小 ， 将 高 校 的 排 课 课表 进行 
一 步 的 优化 ， 找 到 课程 Cx 关联 度 最 高 的 课程 c<， 并 从 别 的 
段 中 找到 能 够 与 之 蔡 换 的 课程 ， 将 两 个 课程 蔡 换 ， 避 人 免 关 
高 的 课程 冲突 。 


SH-AP 是 对 高 校 排 课 进行 优化 的 算法 ,在 原 有 排 课 的 


上 课 的 课程 ， 
有 课程 I 相关 的 课程 


都 有 


扫描 数据 库 ， 根 据 课 程 关联 度 的 大 小 对 课表 进行 优化 , 得 


了 进 
时 
居 度 


村 
五 


基础 


上 增加 了 课程 关系 提升 度 这 一 闵 值 对 已 有 的 高 校 排 课 进 行 


了 进 


一 步 排 课 优化 ， 提 高 了 高 校 排 课 对 于 学 生 学 习 兴 趣 方向 的 


已 谷 


| ChinaXiv 合 作 期 刊 
庞 书 杰 ， 等 : 基于 课程 间 关 联 规则 的 排 课 优化 算 ; 


性 和 精确 性 。 
3 ”实验 结果 与 分 析 


3.1 实验 数据 

本 次 实验 所 采用 的 数据 是 国内 某 高 校 的 某 学 院 的 学 生 的 大 
学 本 科 期 间 的 选课 情况 。 其 中 包括 了 该 专业 学 生 大 学 四 年 的 校 
任 选课 以 及 专业 选修 课 的 选课 情况 。 实 验 数 据 挑选 了 该 专业 各 
个 方向 的 选修 课 ， 保 证 了 选课 课程 的 全 面 性 与 覆盖 面 。 

数据 集 一 共 是 有 527 个 事务 集 组 成 ， 每 一 个 事务 集 都 是 每 
个 学 生 大 学 本 科 期 间 的 选课 情况 。 项 目 集 包 括 计 算 机 导论 、 数 
据 库 原理 、 艺 术 鉴 赏 、 影 视 鉴赏 、Java 面向 对 象 、Android 课 
程 学 习 、Flash 动画 制作 与 欣赏 、 图 、 机 器 视觉 、 
单片机 原理 以 及 谋 入 式 系统 等 。 在 数据 预 处 理 中 ， 将 各 类 课程 
通过 不 同 的 数字 代替 。 
3.2 评价 标准 

关联 规则 的 可 信和 度 以 及 实用 性 的 评测 指标 为 其 支持 度 与 置 
信 度 。 在 对 高 校 选课 排 课 的 关联 规则 进行 挖掘 的 时 候 ， 需 要 得 
到 课程 之 间 的 关联 规则 的 三 个 评价 指标 : 支持 度 、 置 信 度 和 提 
升 度 。 

1) 支 持 度 (support) 
通俗 地 讲 ， 一 组 项 目 出 现 的 频率 就 是 其 支持 度 ， 即 项 目 在 
总 的 数据 集 D 中 出 现 的 次 数 。 定义 上 讲 支 持 度 就 等 于 该 项 目 在 
事务 集 D 中 出 现 的 次 数 比 上 事务 数据 集 D 的 总 数 的 比值 。 


ll 


学 原理 与 应 


Nhl 


A 


IT:X eT,TeD| 


Dp 


其 中 : X 为 所 求 支持 度 的 项 目 ，T 为 项 目 X 所 在 的 事务 T，T 
属于 事务 集 D。 分 子 为 包含 项 目 XX 的 事务 TT 的 个 数 ， 分母 为 事 
务 集 D 的 总 个 数 。 


Support(X)=P(X)= x100% (1) 


2) 置 信和 度 (confidence) 


在 挖掘 关联 规则 的 中 ， 要 产生 关联 规则 就 是 要 通过 上 面 计 


算 的 支持 度 来 进一步 产生 规则 ， 而 产生 的 规则 则 是 要 满足 最 小 
信 度 的 要 求 。 置信 度 就 是 项 目 集合 C 中 已经 包含 X 的 条 件 下 
包含 Y 的 概率 ， 即 条 件 概率 。 
Conf (X > Y) = ODOM (2) 
Support(X) 


X 与 了 的 支持 度 比 上 XX 的 支持 度 ， 就 可 以 得 到 和 与 了 产 
生 的 关联 规则 的 置信 度 。 


3) 提 升 度 〈lift) 


提升 度 是 指 组 合 {A,B} 中 选择 A 的 同时 也 选择 了 B 的 比例 
与 选择 B 的 所 占 总 数 的 比例 的 比值 。 


Conf (A—»B) P(A&B,) 


Os Suppori(B) P(A)P®B) 


(3) 
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其 中 : lift 就 是 代表 了 组 合 的 提升 度 。 


P(A&B)/P(A) 就 是 组 合 


{A,B} 的 置信 和 度 conf，P(B) 则 是 B 的 基于 数据 集 的 支持 度 sup。 


如 果 产 生 的 关联 规则 能 够 满足 最 小 


信 度 minsup 的 阔 值 和 最 


小 置信 度 minconf 的 阐 值 ， 以 及 Lift 的 值 大 于 1 就 可 以 认为 该 


关联 规则 是 可 信 的 ， 有 参考 价值 的 。 
3.3 结果 分 析 
在 学 生 选 课 关 联 规 则 的 实验 测试 中 事务 集 D 为 527 个 学 生 
的 选课 数据 的 总 集合 ， 其 中 课程 项 目 集合 I 有 11 门 课程 。 将 学 
生 的 选课 数据 进行 处 理 ， 课 程 通过 数字 代替 。 如 表 1 所 示 。 
表 1 数据 预 处 理 

TID 课程 

T100 4,9,10,11 

T200 2,5,6,7 

T300 1,3,4,6,7,10,11 

T400 2,4,5,6,11 

T500 2,5,6,8,11 

T600 1,2,3,6,10,11 

T700 1,3,8,11 

T800 3,4,5 


表 1 中 展示 了 部 分 学 生 选 课 数 据 ,将 这 些 处 理 过 的 数据 
入 到 高 校 排 课 优 化 算法 SA-HP 中 ,根据 设 


下 


的 最 小 支持 


minsup 的 阔 值 以 及 最 小 置信 和 度 minconf 的 立 值 进行 关联 规则 区 


挖掘 。 


四 


通过 选课 课程 关联 规则 算法 的 挖掘 得 到 了 关联 规则 ， 
各 项 关联 规则 的 频率 、 支 持 度 和 置信 和 度 。 表 2 中 


度 
的 


以 及 
展示 了 挖掘 结 


3.4 相关 工作 对 比 
SH-AP 算法 与 基于 Apriori 的 高 校 排 课 算法 ， 以 及 基于 文 


献 [15] 中 提出 的 F2AM 算 光 
算法 是 近 几 年 提出 的 关联 规则 算法 .实验 环境 为 :CPU 为 Intelow 
CoreTM i7-7700， 主 频 3.60 GHz， 内 存 为 8 GB。 算 法 都 是 采用 
行 编写 ， JDK 使 用 1.8.0 版 本 ， 在 Eclipse 的 环境 1 


Java 语言 进 


Chi 


基于 课程 间 3 
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Nn 
联 规则 的 排 课 优化 算 ; 


进行 编 


与 运行 。 
1 表示 了 不 同 最 小 支持 度 下 的 Apriori 算法 、F2AM 算法 


的 高 校 排 课 算法 


进行 比较 ,其 中 F2A 


pa 


与 SH-AP 算法 运行 时 间 的 大 小 。 不 同 的 最 小 支持 度 下 比较 了 三 


种 算法 在 不 同 最 小 支持 度 下 的 算法 的 性 能 。 
支持 度 较 低 的 时 候 ， 三 种 算法 的 时 间 
相差 较 大 ，F2AM 算法 虽然 优 于 Apriori 算法 ， 但 SH-AP 算法 
明显 优 于 F2AM 算法 。 而 伴随 着 最 小 支持 
据 库 的 迭代 次 数 减 少 ， 产 9 
减少 , 三 种 算法 的 时 间 ] 


也 昌 


由 


E 的 候选 项 集 
于 销 都 比较 低 。 但 SH-AP 算法 的 运行 


图 可 知 ， 在 最 小 


花 销 


度 的 提高 ， 扫 描 数 
以 及 频繁 项 集 的 个 数 大 


时 间 也 都 小 于 Apriori 算法 与 F2AM 算法 。 


运行 时 间 /ms 


pe 


0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 


一 国 一 Apriorn - 


区 


1 不 同 


图 2 则 表示 了 在 相同 最 小 支持 


最 小 支持 度 /% 
a F2AM —e— SH-AP 


支持 度 的 算法 对 比 


度 ， 不 同 的 最 小 置信 度 的 条 


六 表 2 实验 结果 件 下 , Apriori 算法 、F2AM 算法 和 SH-AP 算法 运行 时 间 的 大 小 
nt 0 的 比较 。 比 较 了 三 种 算法 在 最 小 支持 度 为 定 值 ， 不 同 最 小 支持 
， 度 下 的 算法 的 性 能 。 由 图 可 知 在 不 同 的 置信 度 下 ， 三 种 算法 的 
本 人 运算 时 间 波 动 不 大 ， 这 主要 是 由 于 求 得 置信 度 部 分 ， 主 要 是 基 
ne 和 人 图 和 于 支持 度 上 的 数学 运算 。 之 前 求 支持 度 时 ， 已 将 各 项 集 的 计数 
jo6 和 和 存储 ， 运 算 所 需 开销 较 低 。 由 表 可 知 ， 虽 然 E2AM 算法 在 运算 
ER em es 这 时 间 上 优 于 Apriori 算法 ， 但 本 文 提出 的 SH-AP 算法 的 运行 时 
实验 结果 可 以 看 出 ， 得 到 的 关联 规则 的 支持 度 大 于 0.2， ”站 也 同样 明显 优 于 以 上 两 种 算法 ，。 
置信 度 大 于 0.7 以 及 提升 率 大 于 1。 关 联 规则 中 2、5、6 和 8 i 
分 别 代 表 了 课程 : 数据 库 原理 与 应 用 、Java 面向 对 象 、Android RISE 
课程 学 习 和 图 形 学 原理 与 应 用 。2 与 5、5 与 6、8 与 2、8 与 5 RS 
以 及 2、6 与 5 产生 了 强 关联 规则 ,它们 的 课程 同时 受到 了 多 名 从 
学 生 的 选择 。 在 高 校 排 课 优化 时 应 优先 对 Lift 值 高 的 8 与 2 课 
程 进行 排 课 ， 然 后 根据 Lift 大 小 依次 排序 避免 这 几 门 课程 之 间 so 
的 时 间 以 及 空间 上 的 冲突 。 On 
根据 以 上 实验 得 到 的 结论 ， 以 及 测试 的 指标 达到 的 数值 。 ee 
可 以 看 出 基于 关联 规则 的 高 校 排 课 优 化 算法 (SH-AP 算法 ) 可 以 图 2 不 同 置信 度 的 算法 对 比 
允 丙 校生 保本 到 候 好 亲信 人 人。 通过 比较 三 种 算法 不 同 支持 度 下 的 运行 时 间 ， 以 及 对 比 三 
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种 算法 不 同 置信 和 度 下 的 运行 时 间 ， 可 以 看 出 在 对 大 量 学 生 选课 


数 和 


于 Apriori 算法 与 F2AM 算 沪 
生 选 课 课程 间 关 联 规则 分 析 的 方 


4 


(SH-AP 算法 )。 根 据 学 生 1 
的 关联 规则 算法 对 课程 间 关 系 进 行 发 气 
升 度 阔 值 .将 表示 课程 间 


根 


课程 的 上 课时 间 地 点 冲突 的 同时 ， 兼 


克 


局 进行 关 


类 规则 挖掘 的 时 候 ，SH-AP 算法 的 挖掘 效率 明显 高 
KE 。 这 也 说 明了 SH-AP 算法 在 对 学 


而 有 很 好 的 效果 。 


结束 语 


本 文 提出 了 一 种 基于 课程 间 关 


门 选课 产生 


居 规 则 的 排 课 优化 算法 
的 数据 ， 通 过 数据 挖掘 中 
， 得 到 课程 间 关 系 的 提 
关系 的 提升 度 带 入 到 高 校 排 课 过 程 中 ， 
昌 课 程 间 的 关系 对 高 校 排 课 进行 优化 ， 使 得 高 校 排 课 在 避免 
顾 学 生 选 课 的 需求 。 使 得 


高 校 排 课 更 加 的 合理 化 与 人 性 化 。 


程 的 设立 ， 每 年 都 会 产 大 量 的 学 
现 有 的 串 行 运算 方式 将 不 再 适合 对 大 司 


如 今 ， 随 着 高 校 大 量 的 扩招 学 生 ， 以 及 高 校 更 多 的 新 型 课 
生 选 课 数据 。 数 据 量 的 增 大 ， 


时 的 学 生 选 课 数据 进行 处 


里 ， 影 响 工作 效率 。 下 面 要 根据 数据 大 量 提升 的 情况 ， 将 关联 
规则 算法 并 行 化 ， 方 便 处 理 大 量 数据 ， 减 少 挖掘 课程 关系 是 所 
耗 的 时 间 。 
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